Actividad práctica 1

Autor/a

Semillero R - FacCA

Fecha de publicación

1 de junio de 2019

Planteamiento del problema

Problemas asociados a bases de datos no ordenadas

  • Las variables se almacenan tanto en filas como en columnas.
  • Más de una variable se almacena en una columna.
  • Múltiples tipos de unidades experimentales se almacenan en una misma tabla.
  • Un sólo tipo de unidad experimental se almacena en múltiples tablas.
  • Los encabezados de las columnas, son valores, no variables.

Descripción del problema

  • Bases de datos en múltiples archivos de excel.
  • Si el objetivo de análisis es holístico, no es conveniente tener información disgregada o fraccionada.
  • Unión de datos en función de un factor, individuo u observación común.
  • Caracterizar el comportamiento por países en función de las variables registradas.
  • Objetivo: hacer uso de los temas abordados el semestre pasado para describir y caracterizar la situación global por país.

Bases de datos

Bases de datos (1/2)

Bases de datos (2/2)

Actividad práctica

Ejercicios

  • Unir las bases de datos en un sólo data frame que contenga información para cada país.
  • ¿Cuáles son los 10 países con mayor densidad poblacional?
  • Piense en un gráfico (sólo uno) que permita evidenciar la relación del gasto en educación y el crecimiento del PIB.
  • Genere una nueva variable con información del continente al cual pertenece el país.
  • Con un gráfico o medida trate de mostrar la variación existente en el gasto en investigación y desarrollo por continente.
  • Con un gráfico muestre cómo es la distribución de cada variable numérica.

Tareas pendientes

Tareas